查看原文
其他

现代化数据资产管理,打开企业数据文化宝藏的钥匙

The following article is from 数据老铁匠 Author 张彦龙001

数据的权威性和重要性,伴随着时代的发展而来,已经不需要我们再论证了。

"去年,我们计划通过数据分析带来3千万美元的收入,到去年底,事实上我们做到了1.05亿美元" -- Hilton CDO

"如果没有数据,那你顶多算是一个持有不同观点的人而已。我们相信上帝,除此之外,都请用数据说话" -- W.Edwards Deming,质量管理之父。

"我们会收集所有数据,即使我们现在还不知道该怎么使用它!"-- 贝索斯,Amazon CEO

什么是数据民主化,为什么它很重要?

企业内,要实现数字化转型的话,塑造企业数据文化是当务之急。数据的民主化,就是为了让数据大众化,让所有用户都可以平等的接触和使用数据,如:

  • 财务分析、HR 人力资源分析、运营分析

  • 数据科学家进行的数据洞察

所谓”旧时王谢堂前燕,飞入寻常百姓家“。要实现数据民主化,必须极大的降低数据门槛,让本来只有IT专家可以做的事情,变的简单:让那些需要数据的人,都可以自助的发现、收集、并分析数据。

这是大数据最好的时代,这也是大数据最差的时代

多年摸爬滚打后,我们才逐渐认识到,基于事实的、数据驱动文化对一家公司是何等重要!

在这个基础上,数据在逐步的资产化,并在向货币化演进。这么一个不争的事实被认可了:随意丢弃过时的旧数据,曾经是多么错误的决定

数据可以帮助我们发现反直觉的真相、找出生产链中低效的环节、发展潜在的商机。目前,数据已经是企业控制成本、提升利润,向精益运营转型的重要手段

大数据已经是大势所趋,不可逆转的潮流。然而,如何真正实现洪流落地、赋能商业,面临的挑战却也是前所未有的:

  • 数据安全与个人隐私如何解决?

  • 企业发展多年,数据孤立严重,如何找到并唤醒这些数据?

  • 打通数据孤岛后,部门之间利益如何重新平衡?

  • 企业内数据文化如何培养?

这些问题,个个都是致命的要害,任何一个,都可以让你的公司退变成数据荒漠。

一个数据公民的工作桌面

下图,是一个普通数据分析师或数据科学家的工具箱,和日常工作的一部分:

从数据准备、数据建模、到数据训练各个环节,数据科学家们已经装备了十八般武器,从python到Tableau。在我们的心目中,他们的形象,是这样的:

膜拜啊...我也要变成数据科学家......

且慢!请君留步!我们换个角度,再看看数据科学家的日常是如何工作的:

从数据流向的角度来看,科学家处在中下游,要想拿十八般兵器开练,还需要原料的支持,那就是数据。

而数据从生产系统生成、到采集、入湖、清洗、建仓,这些环节,都是数据科学家鞭长莫及的。

我们发现,数据科学家们欠缺的不是工具,而是数据,如何高效、方便、安全的获取数据,才是他们的痛中之痛:

数据科学之殇

再精良的装备,也无奈糟糕的数据。我们在一丝不苟的做着数据分析和数据挖掘,若数据没有保障的话,又有谁敢说我们做的不是一件"garbage in garbage out"的事呢?

从数据这个角度出发,从数据查找、理解数据、到分析数据,每一步都像是在迷宫里探索,运气好,才能撞出去...

如何破解数据科学之殇-数据迷宫呢?答案就是引入现代化的Data Catalog

现代化的Data Catalog

我们从数据分析师的例子讲开。从有想法、到数据验证的整个周期内,寻找合适数据、理解数据、信任数据、使用数据这四个环节的耗时分布大致如下:

令人惊奇的是,这四个阶段上耗费的时间,呈漏斗状分布。我们仅用了几个小时去分析数据,但是却用了数天、甚至数周去寻找这些数据!这也从侧面印证了我们之前的论断:分析工具集已经不是数据公民们最薄弱的环节

现代化的Data Catalog需要和其他数据工具一样,作为数据科学家工作桌面上的必备选项之一

为什么要强调是现代化的Data Catalog呢?主要还是从目标出发,传统的数据目录工具已经不少,但都无法很好的解决发现和理解数据的问题,因为:

  1. 传统Data Catalog是从管理的角度来归集数据的

  2. 传统Data Catalog的目标不是数据民主化,不是为了赋予数据公民平等的使用权

现代化的Data Catalog则不同,主要是:

  1. 现代化的Data Catalog以人为中心,人才是数据资产的核心,治理数据的最终目的是理顺人与人之间的关系

  2. 从数据治理的角度,现代化的Data Catalog,认为数据是活的,数据之间的关系、数据与人之间的关系与数据本身同等重要,这是大数据的本质

通过人-人、人-数据、人-知识、数据-数据之间的关系,可以把整个公司的数据资产构建成知识图谱。

通过关系,把数据、人、知识、之间的关系构建起来,它是数据资产间流通的血液,这个基于关系打造的图谱,就是现代化Data Catalog的核心引擎。

现代化的Data Catalog可以做什么?

新入职的员工

新入职的员工,急需了解公司的数据全貌和某领域细节,现代化的Data Catalog需要提供关联的专题导引

可快速与最合适的人交流

相信数据分析师们都不会反对这个结论:向懂的人请教一分钟,可以节省自己一整天的时间。关键是如何找到最懂的人?


通过现代化Data Catalog的核心图谱引擎,我们可以还原出:

  • 是谁生产的这份数据,找到数据负责人

  • 都有哪些人使用过这份数据,是在什么时候,以及都是怎么用的,从而找到数据专家

然后,通过内置接口,当场唤起沟通工具进行交流:

  1. 问答社区,内容全员可见,方便全员协作

  2. IM,定向交流,可快速解决问题

  3. 知识库,查看专家留下的宝贵经验。知识库可以通过智能问答机器人提供更具引导性的建议。

别人对这份数据的态度

“随大流 不挨揍”, 话糙理不糙。在大数据时代,就不要做少数派啦....

在使用一份数据之前,看看是不是有其他人用过,以及反馈如何,是省时省力的方法。现代化的Data Catalog需要提供这方面的支持。

我们可以通过反馈、备注、聊天记录、知识库、TAG、FLAG等不同方式,把用户在这份数据上的行为和体验沉淀下来,这就是这份数据的画像。

数据复用

有现成的,谁不用啊!在大数据领域更是如此,因为分析师们周而复始的、重复类似的数据需求,现代化的Data Catalog不仅需要支持经验的沉淀,更需要支持结果的直接复用!

众包模式

独乐乐,不如众乐乐。数据负责人,就是有三头六臂,也没有办法完善所有的数据描述。现代化的Data Catalog需要引入众包模式,根据实际经验来完善数据描述、使用案例等。

这个特性,是与传统Data Catalog理念明显不同之一。我们没有站在管理的角度,而是相信公民都是贡献者,强调了索取与奉献共存。

写在最后

值得留意的是,你的工具箱中,不缺少数据分析和加工的利器,即使缺少这类工具,你一眼就能识别出来。

但如果缺少合适的Data Catalog,它不但难以识破,而且会导致你迟迟走不到数据驱动的爆点。

(欢迎加入数据工匠知识星球获取更多资讯)


联系我们

扫描二维码关注我们


微信:DaasCai

邮箱:ccjiu@163.com

QQ:3365722008

热门文章


数据资产顶层架构设计实践与思考

关于区块链在数据资产全生命周期管理中应用问题的探讨

【译文】数据价值及其资产化

数据资产价值管理之道

数据中台演进四个阶段和具备的三个能力

我们的使命:发展数据治理行业、普及数据治理知识、改变企业数据管理现状、提高企业数据质量、推动企业走进大数据时代。

我们的愿景:打造数据治理专家、数据治理平台、数据治理生态圈。

我们的价值观:凝聚行业力量、打造数据治理全链条平台、改变数据治理生态圈。

了解更多精彩内容


长按,识别二维码,关注我们吧!

数据工匠俱乐部

微信号:zgsjgjjlb

专注数据治理,推动大数据发展。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存